论文荐读 2020年第1期 | 数据开放获取使科学惠及更广 ——中国开放科学与科学数据开放获取的进展与前瞻
题图源于网络
数据开放获取使科学惠及更广
——中国开放科学与科学数据开放获取的进展与前瞻
陈传夫¹ ² 李秋实¹
(1.武汉大学信息管理学院,武汉,430072;
2.武汉大学信息资源研究中心,武汉,430072)
摘 要
人类面临很多共同挑战,科研成本急剧上涨、研究可重复性,以及公众参与科学,都在挑战现有的研究范式,驱动着全球科研转型。作为新的科学研究范式,以高度协作、开放获取、数据共享、研究透明为特征的开放科学正在全球兴起。中国在开放获取、科学数据开放共享方面具有很大潜力,作出了不懈努力,已经取得了一定成效。同时开放科学面临激励措施不足、社会对开放获取期刊透明度、质量担忧等挑战。从机构、项目、法律、教育合作方面提出进一步推进开放科学实施的建议。
关键词
开放科学, 开放获取, 开放数据, 科学数据, 开放期刊, 数据共享
1 开放科学背景:全球科研在转型
过去数十年间,全球科学发生巨大变化,处于持续的转型与变革中。科学研究正由传统的研究方式、交流方式,演变为数字驱动的科研和数字化的交流。在社会对科学知识需求不断变化以及信息网络技术的助力下,科学知识生产范式发生了重大变革和转型,科学社区正在经历着由传统闭合式科学向高度开放科学范式的根本转型[1]。
1.1 全球科学从未面临人类如今关注的共同问题
在相互依存达到前所未有高度的时代,人类面临着日益紧迫的全球性难题。气候、资源、健康、环境、能源、安全等问题加速溢出,已经对全人类生存和可持续发展构成严峻挑战,需要通过科研的开放合作应对共同挑战。与此同时,重大科学发现、前沿科技创新也越来越依赖深度的国际合作与协调,全球超过三分之一的研究论文直接来自于国际合作[2],科学 的全球化日趋广泛深入,开放、协作成为科学研究的常态。
在转型的历史时刻,全球科学比历史上任何一个时期,都更加关注人类面临的共同挑战。以跨学科、跨地域、跨部门的研究协作为核心,致力于解决全球政治、经济、社会现实问题,面向宽广领域应用的“开放科学”的愿景与实践,为应对科技与人类社会发展的全球性问题提供了有效的解决方案。以药物研发领域为例,运用开放科学、开放创新、开放获取和开放源代码的一系列开放协作的方法加速了抗疟疾新药研发[3],促使开放原则推广应用于更多领域科学创新发现。全球科学社区携手共同应对全球性科学挑战,成为开放科学产生的现实驱动力。
1.2 科研成本急剧上涨
全球科研成本在急剧提高,催生了对开放获取的强烈需求。期刊等出版物的价格三十年间上升了数倍。根据EBSCO数据库商发布的最新《五年期刊价格增长》报告,2014—2018年高校期刊订阅成本上升比例高达 23.82%[4]。2019年欧洲大学协会 (EUA) 对 30个欧洲国家的31个协会的调查报告显示, 每年至少花费10.25亿欧元用于电子资源(包括期刊、数据库、电子书)订购,与五家大型出版商——美国化学学会(ACS)、爱思唯尔(Elsevier)、威利 (Wiley)、施普林格·自然 (Springer Nature)和泰勒-弗朗西斯集团(Taylor & Francis)签订合同的期刊成本平均每年以3.6%的速度上涨[5]。
现代科学研究范式下科学研究的重点已逐渐从纯基础研究转向综合性的“大科学”研究,国际范围内的科研仪器设备、基础设施、大科学装置耗资巨大。如目前已建成的中国上海光源大科学装置总投资逾12亿人民币[6], 在建的欧洲散裂中子源项目成本预估高达18亿欧元[7]。
科技文献资源价格上涨、科研基础设施费用上升,不断增加的科研数据收集、获取与存储、发布成本,激发了全球范围内开放科学运动的需求。通过实施开放获取、开放数据为核心的开放科学政策和要求,加强国际科研基础设施的长期可持续性[8],能够优化研究资源配置效率、降低科研产出的单位成本。
1.3 全球更加关注科研诚信与研究伦理
近年来科研失信行为的案例频频爆发,并在全球蔓延,如大规模撤稿事件、研究人员伪造、篡改和剽窃行为被揭露,科学研究成果面临再现性危机[9],引起国际科学社区和媒体、 社会的广泛关注。美国国家科学院《促进研究诚信》的报告指出伪造、篡改或剽窃和有问题的研究行为等有害的研究实践,损害研究的有效性、科研诚信,加剧科学信任风险[10]。
全球社会更加关注科研诚信与科研伦理问题。早在20世纪60年代,科学界已经开始反思科研事业普遍存在的学术交流机制等引发的问题[11]。1985年英国皇家学会发布《公众理解科学》报告揭示了公众对科学家和政府的信任度下降等值得忧虑的现象[12]。全球范围内政府部门、教育科研机构、专业学会和国际组织协同开展科研诚信建设,通过出台国家法律法规、政策规范(如英国《支持研究完整性的标准》The Concordat to Support Research Integrity、丹麦《科研不端行为法案》Act on Re- search Misconduct etc.、日本《科学家行为准则》Code of Conducts for Scientists),制订国际科研诚信相关的声明、原则、指南纲领(如国际科学院组织《开展国际化与合作性科学研究:全球科研事业中负责任的行为指南》Doing Global Science: A Guide to Responsible Conduct in the Global Research Enterprise、欧盟委员会《欧洲科研诚信准则》European Code of Conduct for Research Integrity、全球研究理事会《科研诚信原则声明》Statement of Principles for Research Integrity),召开世界科研诚信大会(2007—2019年共召开六届),构建开放合作的科研文化。
开放科学顺应研究方式改变的趋势,通过研究数据共享、开放同行评审、社会公众监督提升研究透明性,遏制科研不端行为,培养负责任的研究行为,促进科研诚信。作为支持开放科学承诺的一部分,科睿唯安学术研究事业部与英国皇家物理学会出版社(IOP Publishing)达成合作伙伴关系,在IOP旗下物理科学等领域的主要期刊中引入业内首个跨出版商的可扩展透明同行评议工作流程,鼓励和支持作者通过开放数据试验将数据提供给读者、审稿人和编辑,同时遵循最佳实践数据隐私规则[13]。
1.4 公众参与科学的愿望更加强烈
公众需要参与科学。一方面,科研成果的商业化及社会化应用关乎全体社会公众的利益,涉及政治、经济、法律、伦理等方面。作为利益相关者的社会公众,对转基因食品、气候变化、环境、疫苗等方面的认知可能存在偏差, 有必要通过参与科学增进公众对科学的理解与认知,提高公众科学素质和参与科技决策的能力,进而解决自身面临的食品安全、医疗健康、人居环境等问题。
另一方面,科研造假、违背伦理现象时有发生,科研失信屡禁不止,成为亟待解决的社会问题。科学面临公众信任危机,重建公众对科学的信任刻不容缓。开放科学所倡导的科研透明需要社会监督。通过公众对公共资金资助的科学研究成果获取和参与研究过程进行社会监督,促进负责任的研究与创新。科学传播中以科学界为中心自上而下单向流动,正逐渐发展成为以对话和民主参与为特征的民主形式[14]。以公众参与为重要特征的开放科学,有助于弥合科学公共空间中科学家与公众知识上的不对等,促进专家与公众的理性交流、对话,为公众信任科学提供契机,进一步健全多主体互动的科技创新治理机制。
全球科学共同体面临的这些挑战和需求,关系到科研成果、科学数据的开放获取与共享,研究透明和可复现,科学的公共传播、公众对科学的理解与信任,科研创新效率等重大问题。开放科学运动应运而生,在范围和深度上不断拓展,受到国际社会的普遍关注。欧盟、 法国、芬兰相继出台开放科学计划,如美国《开放科学设计:实现21世纪的研究愿景》(Open Science by Design: Realizing a Vision for 21st Century Research)[15]、法国国家开放科学计划 (National Plan for Open Science), 欧盟2016 年发起“欧洲开放科学云计划 ” (European Open Science Cloud,EOSC)、发布《欧洲开放科学云实施路线图》,芬兰制定《2014-2017开放科学与研究路线图》、并启动了“开放科学与研究计划”(Open Science and Research Initiative),引领世界开放科学运动潮流。
2 国家强劲的研究与试验投入使中国具有贡献世界开放科学的潜力
2.1 中国持续加大科研经费与人力投入
中国高度重视科技事业发展和创新型国家建设,致力于建设世界科技强国,实施创新驱动发展战略。近年来科研产出和科技实力大幅提升,具有贡献世界的巨大潜力。
提高自主创新能力、建设创新型国家是《国家中长期科学和技术发展规划纲要(2006-2020年)》提出的战略目标。自纲要颁布实施以来,中国科技创新能力持续增强,创新资源投入持续增加。中国持续加大科技经费和人力投入力度,研究与试验发展经费(R&D)投入以及研发人员水平稳步提高。
2018年《国家创新指数报告》测算结果显 示[16],中国 R&D经费达到2359.4亿美元,连续4年居世界第2位,占全球的份额为6.1%。中国 R&D总投入在2008—2018年间翻了两番,占全球研发支出的份 额 逐 渐 上 升。R&D经费投入强度(R&D/GDP)稳步提升,自2016年起首次超过欧盟15国平均水平(2.09%),2018年增至2.19%[17]。中国 R&D人员总量为387.8万人年, 占全球 R&D人员总量的 31.0%,连续10年居世界首位。
美国国家科学基金会发布的《科学与工程指标 2018》报告,认为中国继续显示了最有力的研发增长,2000年至2015年期间研发支出增长占全球增长的近 1/3。中国虽然起步基础较低,但研发强度在过去10年里大幅上升。从研究人员的数量来看,较之美国和欧盟的平稳较低增长,中国研究人员数量一直在持续大幅增长(2015年仅次于欧盟)[18]。
2.2 科学研究产出规模持续扩大、质量不断提升
伴随着巨量的科技投入,中国科研产出的质量和国家整体创新能力不断提升。一方面,中国研究产出的规模持续扩大。2016年起中国论文出版总量增长很快[18]。另一方面,科研产出的质量也在不断提升。据世界知识产权组织全球创新指数(Global Innovation Index, GII)测算,中国的创新水平连续第四年保持上升势头,2019年位居世界第14位[19]。学术研 究影响力不断上升。全球高被引top1%论文是衡量科研成果影响力的重要指标,近年来中国top1%论文成果的比例不断上升,2000—2014年由0.4%上升至1%[18]。2018 年高校发表论文的规范化引文影响力达到全球平均水平的1.2倍[20]。2009—2019年中国发表的国际热点论文和国际高被引论文数量仅次于美国,占世界份额分别为32.6%和20.0%[21]。
2.3 中国产出、管理了巨量的科研数据
我国数据资源稳步增长,来源广泛。据不完全统计,截至2017年底,我国有效管理与保存的科学数据资源共计约达83.72PB,这些数据资源主要集中在生命科学与医学、地球与环境科学、物理和化学、农业与林业科学、天文与空间科学等领域[22]。同时各个领域产出、管理的数据在国际上被广泛下载、利用,以国家基础科学数据共享服务平台 (http://www.nsdata.cn) 为例,数据累计下载总量超过1752.83TB,其中美国、捷克、德国等国家的访 问、下载量位居前列[23]。总体而言,经过十多年的发展,中国已成为研究投入大国、研究论文大国和科学数据大国,具有为国际开放科学与开放数据、开放获取做出卓越贡献的潜力。
3 中国对开放科学、开放获取机制持支持态度
应对全人类共同的重大现实挑战和科学共同体面临的发展困境需要发展开放科学,而开放数据获取是开放科学的核心措施。中国高度认可开放科学和开放获取的意义,积极开展国际合作,参与全球开放科学和开放获取进程且不断升华,对开放科学和开放数据获取的立场是明确、坚定且积极的,致力于通过科学 数据的开放获取,服务科技事业发展和国家改革开放与发展的需要,服务全人类的科研需和共同福祉。
中国明确地支持对科学知识开放获取的目标,支持开放科学发展。2014年5月27日, 李克强总理在全球研究理事会 (Global Research Council, GRC)年会开幕式上明确指出, “支持建立公共财政资助的科学知识开放获取机制,促进中国和世界科学事业共同发展”[24]。中国明确且坚定地支持开放数据获取,是国际开放获取运动的先行者之一,积极开展国际合作,促进全球开放获取运动发展。
3.1 国家学术机构、研究资助机构的倡导
▶ 3.1.1 中国是国际开放获取计划的先驱与主要推动者
中国是国际开放获取(Open Access,OA)计划的先驱与主要推动者,为科学数据开放获取做出了积极贡献。早在本世纪初,中国启动国家科学数据共享工程不久,中国有关机构就承诺共同推动国际开放获取计划。中国科学院、国家自然科学基金会先后签署加入《开放获取柏林宣言》等国际文件。2010 年中国科学院与德国马普学会在北京共同举办主题为“开放获取:实施进展、最佳实践与未来挑战”的第八届开放获取柏林会议[25]。同时,推动成立了全球研究理事会,支持其开放获取行动计划(GRC Open Access Action Plan)[26]。
▶ 3.1.2 图书馆与信息机构倡导并支持OA2020
2016年德国马普学会发布了促进开放获取新国际倡议OA2020: Initiative for the Large-Scale Transformation to Open Access (大规模学术期刊开放获取倡议)。该计划旨在通过将大多数学术期刊从订阅模式转变为开放获取模式,由期刊订购经费转向开放出版费用,以提升研究成果的开放、重用,并实现出版成本的透明和可持续模式[27]。截至目前中 国已经有中国科学院、国家科学图书馆、国家科技图书文献中心、北京大学图书馆、清华大学图书馆等18家机构(图书馆/信息研究所) 签署了OA2020意向书。
▶ 3.1.3 中国科研社团组织对S计划持积极态度
S计划(Plan S)是2018年欧洲委员会等11个欧洲国家研究资助机构共同发起、实现从2020年起公共资金资助产出的研究成果立即开放获取的项目[28]。2018年12月召开的第14届柏林开放获取 Open Access 2020会议上,国家自然科学基金委、国家科技图书文献中心、中国科学院文献情报中心相关负责人明确表示支持 OA2020和开放获取S计划,支持公共资助项目研究论文立即开放获取。2019 年3月26日,中国大陆的签署机构讨论对S计划实施指南的反馈意见,表达了积极推进开放获取、积极参与国际范围的开放获取与开放知识环境的规则制定和基础设施建设的强烈愿意[29]。
▶ 3.1.4 中国科技界的立场受到国际上的高度评价
中国对开放数据获取的立场受到国际上的高度评价。中国对开放数据获取的立场受到国际科学社区的高度关注。具有很高声望的《科学》、《自然》杂志持续关注中国相关机构的开放获取政策。国际舆论认为中国的开放获取政策对国际开放获取计划的发展是关键一步(a crucial step)[30],充满期待。
4 中国为促进开放获取与数据资源共享不懈努力
以开放为要义的开放科学和开放数据获取要求采取切实行动,以充分发挥数据资源的价值,支持开放科学,服务全球科技发展转型和人类文明进步。为践行这一立场与实现这一目标,中国从开放共享政策、数据开放共享平台构建等方面做出了巨大的努力,探索开放科学深化发展的方向和路径。
4.1 科学数据开放共享政策
科学数据开放获取符合中国的发展利益。从2004年起,国务院、科技部等政府部门出台了一系列数据开放与共享的政策支持科学数据开放,建立健全数据共享的机制、法规、管理办法及监督机制等立法工作。科学数据开放与共享是中国可持续发展的需要,具有普遍的社会共识。2004年《2004-2010年国家科技基础条件平台建设纲要》将形成以共享为核心的制度体系、构建重要科技基础条件资源信息平台作为主要任务和建设目标。2006 年《国家中长期科学和技术发展规划纲要(2006-2020年)》提出建立科技基础条件平台的共享机制,促进科学数据与科技文献资源的共享。
国家自然科学基金委员会和中国科学院分别发布《关于受资助项目科研论文实行开放获取的政策声明》、《关于公共资助科研项目发表的论文实行开放获取的政策声明》,支持公共资助的科研论文的开放获取。2015年国务院发布《促进大数据发展行动纲要》提出发展科学大数据,积极推动由国家公共财政支持的公益性科研活动获取和产生的科学数据逐步 开放共享,构建科学大数据国家重大基础设施,实现对国家重要科技数据的权威汇集、长期保存、集成管理和全面共享。
2018年国务院办公厅发布《科学数据管理办法》要求“政府预算资金资助形成的科学数据应当按照开放为常态、不开放为例外的原则,接入国家数据共享交换平台,面向社会和相关部门开放共享”。我国科学数据开放、共享、管理的政策顶层设计不断细化、扩展,形成了较为完整的开放政策体系,为开放获取、数据共享实践明确了方向。
4.2 科学数据共享平台建设及成效
在老一辈科学家的倡导与国家支持下,我国自2001年底开始实施国家科学数据共享工程试验计划,启动首批9个科学数据共享试点。以此为基础,在《“十一五”国家科技基础条件平台实施意见》的指导下,2005年正式启动实施了国家科技基础条件平台专项计划, 2011年国家生态系统观测研究网络等 23 个 首批国家科技基础条件平台通过认定。
我国在科学数据生产、采集、共享等方面取得了世界公认的成绩。建设了一批国家科学数据管理中心,建立了国家基础科学数据共享服务平台、国家地震科学数据、国家气象科学数据共享平台等,代表了各学科领域优质科学数据资源水平。十二五期间中科院启动“科技数据资源整合与共享工程”建设,截至2015年底,该工程系统地整合58家单位的科学数据库,可共享数据量达655TB。国外用户积极利用中科院 的机构知识库和数据云,截至2019年12月底来自美国的用户访问占10.24%[31]。
我国科学数据平台直接服务国家科技创新事业,并为美国、欧洲、大洋洲、亚洲、非洲等各国科学家、科学爱好者乃至一般公众提供公益性服务,受到国际上的高度称赞。2006 年第20届国际科技数据委员会(CODATA)学术研讨会上,“地球系统科学数据共享网”和“气象资料共享系统”项目的进展介绍得到了广泛关注和一致好评[32]。2015年国际科学理事会、国际科学院组织、世界科学院、国际社会科学委员会全球四大主要科学组织共同发起的“大数据时代开放数据”的国际宣言中,将中国国家科技基础条件平台作为开放数据平台的典型案例加以推介[33]。2017年由中科院地理科学与资源研究所和中国地理学会联合主办的“全球变化科学研究数据出版与共享系统” 获得联合国世界信息峰会奖电子科技类冠军[34]。
4.3 中国数据开放共享取得实效
▶ 4.3.1 青藏高原数据资源服务于生态环境研究和救灾
中国数据开放共享实践取得了重要成效,对于推动国家科技创新、可持续发展与生态文明建设、民生服务等方面做出了重要贡献。
科学数据的应用成为推进生态文明建设的重要支撑和保障。以青藏高原生态评估为典型案例,通过对遥感、冰川、湖泊、生态、气候等数据的综合运用,成功编制了《西藏高原环境变化科学评估报告》,为我国青藏地区生态可持续发展做出了贡献,也为灾害评估、改善环境等方面提供数据和技术支持。
▶ 4.3.2 航天、探月数据向全球开放
中国促进数据开放共享的努力还在加速进行,并向深度、前沿性数据领域推进。如中国科学院空间应用工程与技术中心的载人航天推广服务平台(http://www.msadc.cn/)面向中外用户,公布了大量的天宫一号、天宫二号、天舟一号数据,促进空间科学与应用数据管理与推广使用。全国政协委员、中国探月工程总设计师吴伟仁表示,将逐步把嫦娥四号探测数据等科学数据向全世界开放,为人类和平利用太空、推动构建人类命运共同体做出贡献[35]。
▶ 4.3.3 开放气象数据和地球系统科学数据
面向社会和公众提供公益、平等、普惠的气象数据、环境数据、海洋数据等服务,每天都有超过1亿人次访问利用这些数据。如中国国家气象信息中心通过建设气象科学专业知识服务系统,气象数据产品共享、专题服务,为防灾减灾、公共服务等提供强有力气象数据支持,年服务量超过1.3PB。
中国推进数据全球共享,造福人类。中国科学数据在惠及国内民众和推动科学发展的同时,也为国际上抗震防灾、灾后重建提供了大量数据援助服务,得到有关政府、国际数据委员会(CODATA)等有关组织的高度赞扬[36]。
▶ 4.3.4 开放基因数据
国际上美国、英国等国家积极实现基因数据库的免费开放获取,对于解决人类共同面临的生存发展问题至关重要。中国国家基因数据库整合了 CNGB、NCBI、EBI和其他来源的大量生物数据,并将继续扩展成为生命科学研究人员和行业的全球资源中心。我国科学家所测定的水稻基因序列[37](A Draft Sequence of the Rice Genome)已被来自全世界20 多个国家的实验室全部反复下载。NSF植物基因组研究计划的首席研究员之一威斯勒认为这些数据使他们的实验提前了一年的时间;韩国植物基因组国家实验室主任安镇和教授认为中国科学家提供的数据使他们的工作提前了近3年[38]。
5 开放获取的挑战与前瞻
5.1 开放科学发展面临挑战
中国支持开放科学发展并已取得一定的实践成效,展现了在全球开放科学国际合作的潜力、良好治理方面的共同前景,但同时也面临着诸多挑战。
▶ 5.1.1 开放科学的激励措施还不足
当前“publish or perish”的学术生态下,有学者指出,我国出版的5000多种科技期刊中科学论文中的很大部分并未被阅读和引用,从而对科学研究价值、科学产出成效提出质疑[39]。大量研究成果与数据未真正实现免费阅读、及时获取,影响了科研经费的投入产出效率,科学研究的社会价值并未得到充分释放。
对国内科研人员数据共享行为的实证研究结果表明,个人因素层面感知利益(学术认可、声誉提升、学术交流、预期回报等)对研究人员的数据共享行为有较明显的积极影响[40],采取优先发表论文、资金鼓励、提高知名度等激励措施可以提升研究人员的共享意愿[41]。制度层面上行业规范、政策等外部环境的压力对共享也有较为明显的影响[42]。而当前我国数据共享开放相关政策未将数据开放共享作为评价导向和标准。研究人员在论文发表数量的压力下,存在过度竞争,将数据共享开放视作学术竞争力的丧失、出版机会的减少,引发数据共享感知风险[43],抑制了共享动机。必须通过学术激励、学术认可机制的改变来推动数据和期刊论文的开放获取。
▶ 5.1.2 社会对开放获取论文与数据质量的担忧
尽管没有证据表明开放获取期刊质量必然不高,但统计表明,Web of Science数据库撤稿文章中 OA 期刊在统计上远远高于传统发表渠道。开放获取期刊(如 PloS ONE)可能存在审稿周期短、审稿不严、发文数量无限制、发文标准不高等问题[44]。研究表明,开放同行评审的质量明显低于传统评审方式[45],科学社区对开放获取期刊的认知度普遍不高[46], 对数据质量存在一定担忧。对组织而言,OA 期刊对研究机构科研绩效的提升作用并不明显,甚至会降低论文被引次数增幅[47]。在当前主流学术评价导向下,影响因子普遍偏低的开放获取期刊很难受到研究人员和学术机构的认可[48],在研究人员招聘、职称晋升和基金项目分配等一系列的学术评价体系中处于劣势地位,阻碍了开放获取参与。
▶ 5.1.3 OA数据与OA期刊透明度问题
国际上一些试验表明,OA期刊在同行评议等环节存在着一些薄弱的现象,很容易出现审稿流于形式,缺乏基本的同行评议和评审不透明的问题。也确有一些“掠夺性期刊”打着OA期刊的牌号,严重影响OA期刊的声誉。一位生物学家将利用计算机程序编造的1篇明显具有造假痕迹的论文投给304家开放获取期刊,最终被157家期刊接受,约60%的最终反馈结果并没有同行评审的迹象,只有36份审稿意见涉及专业性问题[49]。2019年美国内华达州地方法院对欺诈性“开放获取”出版集团OMICS处以5010万美元的罚款[50]。一些掠夺性期刊(如印度的部分不法出版商)以开放获取期刊为由,骗取文章处理费而不提供所承诺的发表服务[51],操作和流程缺乏透明度。掠夺性期刊的爆发使开放获取饱受质疑,可能误将初创、缺乏出版实践经验的开放获取期刊、出版商划入学术出版的黑名单[52],使开放获取期刊论文、开放研究成果面临声誉困境,带来严重负面影响。
▶ 5.1.4 开放获取实施机制问题
开放获取中如何协调资助者、论文作者、出版者、与用户之间的关系,还存在很大争论。即使是 OA 的定义、实现方式也有多种,包括金色开放、绿色开放和其他辅助性模式,需要以互补的方式探索最佳路径。不同利益相关者对开放态度也不相同,首先要解决好付费与初步成本问题。以出版商爱思唯尔为例,OA期刊论文的单篇出版价格甚至高达5000多美 元。如何找到一个可持续发展的OA模式是国际上面临的共同任务。如何解决相应的版权、隐私等问题,也是挑战。以上这些问题,导致许多科研人员虽然支持开放科学的理念,但却难以付诸实践。
5.2 前瞻与合作建议
为推动开放科学的纵深发展,使科学发展惠及更广的人,中国需要同其他国家一道,将开放科学纳入科学创新议程,嵌入全球经济社会合作框架,并加强协调,从机构政策规则合作、科学数据开放与开放获取项目合作、法律政策协同、公共教育合作等方面共同推进负责任高质量的科学研究实践,实现开放科学高质量发展。
▶ 5.2.1 机构合作
国际合作对于应对全球挑战至关重要,开放科学需要各利益相关方参与,调动开放科学实践积极性,共同应对开放科学的各类挑战。
(1)促进学术交流机制的转变。我国应继续加强国家与研究资助机构之间的合作,联合发起科技信息和科研数据共享倡议,促进公共资助研究成果、研究数据的开放获取,实现数据和信息基础设施共享的协调。2013年八国集团(G8)的科技部长与科学院院长共同发表了声明,提出开放研究数据和扩大公共资助研究成果的公开获取;尊重有关隐私、安全和商业利益的关切,承认私人部门合作伙伴的利益;开放的科学研究数据应易于发现、获取、评 估、可理解、可用,并尽可能与特定质量标准互操作[53]。
(2)加强政府、学术界、产业界、公共部门多方合作。促进政府、学术界、用户和行业在研发和监管过程中的协作,通过数据共享、公民科学、众包、虚拟平台等方式,制定统一性开放科学计划和政策,优化管理程序,鼓励形成互动网络和协作研究的平台。
(3)积极参与制定国际利益协调规则。作为发展中国家积极参与国际开放科学的合作治理,增强自身开放科学实施力度,更多地参与开放获取、研究合作的议程和优先事项的制定,以在全球政策协调和规则制定方面发挥更大作用。
▶ 5.2.2 项目合作
开放科学项目、计划的实施是科学研究和创新政策的关键要素,其高度复杂性和高昂的开发、建设和运营成本以及对大量高素质科技人力资源的需求,使得单个国家难以独力支持建设和运营,需要在国际层面作出协调一致的努力。
(1)积极参与国际层面的开放科学实践,共同参与国际开放获取项目、形成新型开放获取模式。当前欧盟提出了多项研究成果开放获取的计划,如上文所述的 S计划、2019年有研究者提出面向全球范围的 U计划[54]。U计划要求科研人员在预印本平台提交研究成果的预印本,缩短出版周期,降低同行评议成本,促进科研创新。
(2)合作共建国际开放科学平台:投资促进开放科学的数据存储、发表平台等全球研究基础设施。开发以增进数据开放、研究透明为目标的数据共享、论文出版、互动交流、资源长期保存、科研评价等多种功能的平台。采用统一的技术软件标准、数据模型实现不同平台的互操作。开发配套的数据挖掘、分析工具,以适应不同学科领域广泛的数据重用需求。
(3)加强合作项目的评估、监管。联合实施开放科学项目评估,对开放研究数据的质量、引用、下载等指标进行绩效评估,提升开放获取数据与发表质量。联合与出版商进行期刊订阅、文章发表费用的利益博弈,通过增加联盟之间对话、更高的透明度和交易合同披露,促进国家层面和研究机构层面建立和完善学术出版成本监测机制,评估学术出版物支出的规模,降低数据获取与出版成本。
▶ 5.2.3 法律政策协同
知识产权相关的法律、政策在科学界传播和使用科学成果的方式中起着决定性作用。通过加强影响开放科学实施的知识产权、隐私 保护以及科研创新方面的国际标准、法律合作,以消除开放获取、科研数据开放等的法律与政策障碍。
共同的标准、准则和规则为实现更积极的融合与凝聚、推动经济发展与社会进步作出重大的贡献。合作制定数据隐私、数据安全与保障方面的共同标准,如欧洲云基础设施、数字内部市场和欧洲法律框架,争取国际学术传播标准制定话语权。
构建与现有知识产权相协调的开放科学法律框架是推动开放科学的重要努力之一。一方面与国际组织合作更新知识产权许可的政策工具。2013年世界知识产权组织 (WIPO)、经济合作与发展组织(OECD)等其他国际组织共同努力,开发了新的知识共享许可, 即知识共享3.0政府间组织许可协议(Creative Commons 3.0 Intergovernmental Organisation (IGO) License)。该许可在一般CC 许可协议基础上,进一步涵盖了与IGO争议解决方案相关的调解或仲裁机制的规定,使IGO 更容易在线分享他们的研究和报告数据和其他数据资源。另一方面关注国际组织考虑修改或增加公共获取、知识产权豁免的规则,以适应开放科学需求。如欧洲议会 2019年通过了《开放数据和公共部门信息的最新指令》(Directiveon Open Data and Public Sector Information),该指令将公共部门信息扩大到涵盖公共资助的研究数据,目的是促进开放数据的使用,并刺激数字单一市场中产品和服务的创新。其中第10条“研究数据”规定,成员国“通过采取国家政策和相关行动,支持研究数据的可用性,以使公共资助的研究数据按照默认开放原则和公平原则公开提供”[55]。
▶ 5.2.4 公共教育合作
(1)成立专门组织机构,加强开放数据、信息共享的公共教育合作与交流。
英国成立了政府资助的非营利组织——开放数据研究所(Open Data Institute, ODI),目标是促进开放数据文化,建立开放、可信赖的数据生态系统。因此通过成立专门机构,与不同利益相关者如政府、商业部门、学术界、公共部门合作,向初创企业、中小企业的开放数据技术人员和企业家开展培训,与高校合作开展开放数据研究,为政府、公共部门开放数据提 供指导以发展数据相关技能,同时开发数据技能框架提升公众数据素养。
(2)合作实施开放科学教育与推广计划
欧盟在“地平线2020计划”框架下,推出了由6个国家的11个合作伙伴开展的为期2年的欧盟资助开放科学培训项目(Facilitate Open Science Training for European Research,FOSTER)[56],促进欧洲研究人员行为向开放科学转变。该项目提供面对面、远程和混合的培训课程,注重课程的实用性和效果;创建高质量的培训资源,包括多模块开放科学工具包和开放科学培训手册;巩固开放科学培训网络,涵盖人文、社会科学和生命科学的学科群体。
(3)倡导、塑造开放科学文化
国家层面,科技管理部门、科研资助机构等应加强宣传推广,使所有的科学组织、大学、团体与公众认识开放科学的价值,培育以开放科学如研究数据共享、公众参与为特征的学术评价导向。在机构层面,发挥大学、图书馆的教育素养培育职能,建立与科研开放、研究透明有关的研究设计、实施与报告方面内容的教育、指导与学习的开放文化。激励科研人员与公众、产业界交流工作,开展更广泛的科学传播活动。在公众个体层面,参与数据素养培训计划、公众科普活动,提升参与政府科技决策的能力,促进研究透明。促进全球科学研究的转型,让科学惠及更多的人。
作者简介
陈传夫(通讯作者),博士,教授,博士生导师,研究方向为信息资源管理、知识产权、图书馆发展理论等。
李秋实,博士生,研究方向为信息资源管理、知识产权、图书馆发展。
参考文献
*原文载于《信息资源管理学报》2020年第1期4-13页,欢迎个人转发,公众号转载请联系后台。
*本文引用格式:
陈传夫,李秋实.数据开放获取使科学惠及更广——中国开放科学与科学数据开放获取的进展与前瞻[J].信息资源管理学报,2020,10(1):4-13.
制版编辑 | 王小燕
• 论文荐读 2019年第4期 | 专题前言:学术评价研究的新视角
• 论文荐读 2019年第4期 | 被引数量、被引质量和被引离散度结合的学术期刊影响力评价研究
• 论文荐读 2019年第4期 | 个人相对引文率(ARCR):作者影响力评价新指标